为什么你的AI作图被一眼识破?先读懂这些隐藏缺陷
(标题及部分内容由deepseek辅助)
本文聚焦Stable Diffusion生成图像的鉴别要点,通过解析AI作图的典型缺陷与风格规律,帮助创作者建立鉴别能力——只有精准发现问题,才能针对性优化作品。
注意,笔者仅聚焦于现阶段的主流的Stable Diffusion模型,不同的模型(如FLUX、Midjourney等)、不同的底模鉴别方法可能不同。
扩散模型通过多轮降噪生成图像的特性,在迭代不足或构图复杂时,常导致局部结构异常。 典型表现为:


此类技术瑕疵具有明显辨识度,可作为直接判断依据。
人类画作的每一次落笔都有逻辑作为支撑,但AI作图并没有人类这么强的逻辑性,经常出现画面交代不清的情况,这些AI痕迹足以作为AI作图的决定性证据。
下图乍看上去比较正常,大体上正确,但是在一些细节之处却有纰漏。例如下图红圈处,一些小的绿色叶子,似叶非叶,似芽非芽,不可名状。

类似的,下图中红框位置皆存在结构不明晰,物体不明确的问题,很容易被鉴别出来。
对于二次元绘画来说,还有一种细节不清的常见情况,就是头发的绘制非常奇怪,发丝之间会糊在一起,甚至会断开。

AI在生成图片时有时候囿于模型的能力,生成图像时常出现违背物理规律或常识的错误。典型例证包括人物手部多指畸形。

下图中左上角的盆栽下方没有架子支撑而悬空;左下角的烟没有来源;右上角出现了两个月亮。
有些逻辑错误非常隐蔽,难以一眼察觉,需要审核人员细致地检查。
与上述的直接证据不同,AI作图有很多风格层面的特征,这些特征虽然不能直接证明此图为AI作图,但是会引起玩家怀疑,进而仔细分析图像,增加识破风险。 虽然笔者描述为“不能直接证明AI作图”,但是实际上看到这些特征,基本有99%的概率能够确定为AI作图,只是无法用明确的证据实锤罢了。这些特征也需要我们尽量避免。
AI风格很大一部分在于,AI总是倾向于突出画面的高对比、高饱和、强动感以形成较为强烈的风格。后文很大一部分都是在围绕这一特点进行展开。
部分AI作图的一个比较明显的特征就是对比非常强烈,后文会多次提到风格&对比强烈这一特征。
如下图所示,树冠的亮处与暗处对比强烈,且色块较大,岩壁处也是同理。

需要特别注意(二维)角色的边缘光。AI绘图非常喜欢给角色边缘打上大面积的、对比强烈的、不正常的边缘光(侧光),千篇一律。
这种特征在二次元角色上极其常见,不同的AI作图,其边缘光形制都非常类似,很好分辨。
AI还特爱使用高饱和度的诸如品红、亮黄色、蓝色等颜色,造成强烈的对比。
在绘制风格化的森林背景时,AI老喜欢把叶片的亮面和暗面对比拉得非常大,且色块面积非常大,可谓是千篇一律。

笔者发现AI在绘制偏艺术的图片时,偶尔会倾向于使用某些笔触,例如喷溅、流动、喷射等富有动感的笔触。

AI面部,特别是写实的AI面部大多都有相同的特点(貌似女性大多是微笑唇)。


艺术家在绘制作品时,非强调部分的细节往往不会绘制得非常细致,但是AI作图有时会生成极其夸张的细节。下图不论是近处的花草还是远处的树木,细节精度都非常夸张,人类艺术家难以企及。

下图的背景非常柔和、模糊。不过貌似有些艺术家也喜爱使用这种极度柔和的效果,所以单凭这一特点还无法100%断定为AI。
下图过于模糊,在使用的lora与底模不兼容或提示词过于强烈、不合理等的情况下容易造成去噪难以快速收敛,出现这种模糊的情况。

下面几张图的问题类似,很多暗部本不该如此之暗,且暗部范围也不应该如此之大,有种钢笔画的感觉。

上述特征为笔者基于大量AI图片进行经验总结的结果,然而很多一眼AI的图片很难归类到上述的类别;同样的,很多符合上述特征的图片也不一定就是AI作图。建议有兴趣的读者到https://civitai.com/images网站上浏览更多的AI图片,强化识别AI的能力。
最后强调一点,本文总结的鉴别规律,目的并不是让读者在别人的作品下“空口鉴AI”,而是能够明晰自己生产的AI作图的缺陷之处,从而去掉画作中的AI痕迹。